DCASE 2024を参考に工夫を考える
from 卒論におけるSEDの工夫を考える
DCASE 2024を参考に工夫を考える
LOCAL AND GLOBAL FEATURES FUSION FOR SOUND EVENT DETECTION WITH HETEROGENEOUS TRAINING DATASET AND POTENTIALLY MISSING LABELS
クロスアテンション
BEATsとCRNNの中間層の特徴を使って学習
Confident Mean Teacher
Mean-Teacherの改良版
Improving Audio Spectrogram Transformers for Sound Event Detection Through Multi-Stage Training
二段階学習
事前学習済みモデル3種でアンサンブル学習し,擬似ラベル(強ラベル)を生成
擬似ラベルを使って全体を学習
SOUND EVENT DETECTION BASED ON AUXILIARY DECODER AND MAXIMUM PROBABILITY AGGREGATION FOR DCASE CHALLENGE 2024 TASK 4
補助デコーダで学習を安定させる
他
後で
? フロントエンドは並列するか連結するか
? バックエンドで時間依存性を学習?